迈向真实世界的软件智能体:如何将语义高亮功能融入智能体编程?
· 26 min read
引言
我们训练了一个代码语义高亮模型SWE-Pruner并开源了配套的Agentic接入框架,在真实的Coding Agent多轮任务(SWE-bench, SWE-QA)上,在保持性能不变甚至提升的情况下提供多轮场景下30%甚至更多的token开销减少。该模型基于语义理解,自动识别并高亮检索到的文档中语义相关的句子。而框架作为agentic的接入层,可以轻松接入claude code,openhands等SOTA agent系统
模型发布
- HuggingFace: https://huggingface.co/ayanami-kitasan/code-pruner
- License: MIT (commercial-friendly)
- Architecture: 0.6B Dual-Head model based on Qwen3-Reranker-0.6B
- Supported Programming Languages: Python
- Github: https://github.com/Ayanami1314/swe-pruner
- arxiv:https://arxiv.org/abs/2601.16746
在本文中,我们将分享我们的技术方案。